Model Selection

Whole Word Masking

# Whole Word Masking

MiniRBT is a Chinese small pre-trained model developed based on knowledge distillation technology, optimized for training efficiency using Whole Word Masking.

Large Language Model

Transformers Chinese

MiniRBT is a Chinese small pretrained model developed based on knowledge distillation technology, optimized for training efficiency using Whole Word Masking.

Large Language Model

Transformers Chinese

MiniRBT is a small Chinese pre-trained model based on knowledge distillation technology, combined with whole word masking, suitable for various Chinese natural language processing tasks.

Large Language Model

Transformers Chinese

Erlangshen DeBERTa V2 320M Chinese

Chinese pre-trained language model based on DeBERTa-v2 architecture with 320 million parameters, excelling in natural language understanding tasks

Large Language Model

Transformers Chinese

Erlangshen DeBERTa V2 97M Chinese

A Chinese DeBERTa-v2 base model specialized in natural language understanding tasks, employing Whole Word Masking with 97 million parameters.

Large Language Model

Transformers Chinese

Bert Base Swedish Cased Ner

Swedish BERT base model released by the National Library of Sweden/KBLab, trained on multi-source texts

Large Language Model Other

Bert Large Uncased Whole Word Masking Squad Int8 0001

BERT-large English Q&A model pre-trained with whole word masking and fine-tuned on SQuAD v1.1, quantized to INT8 precision

Question Answering System

Chinese Bert Wwm

A Chinese pre-trained BERT model using whole word masking strategy, designed to accelerate Chinese natural language processing research.

Large Language Model Chinese

Bert Base Spanish Wwm Cased

BETO is a BERT model trained on a large Spanish corpus, available in both cased and uncased versions, suitable for various Spanish NLP tasks.

Large Language Model Spanish

Bert Base Spanish Wwm Uncased

BETO is a BERT model trained on a large Spanish corpus, supporting both cased and uncased versions, suitable for various Spanish NLP tasks.

Large Language Model Spanish

Bert Base Japanese Basic Char V2

This is a Japanese BERT pre-trained model based on character-level tokenization and whole word masking techniques, requiring no dependency on `fugashi` or `unidic_lite` toolkits.

Large Language Model

Transformers Japanese

hiroshi-matsuda-rit

Umberto Commoncrawl Cased V1

Italian language model based on the Roberta architecture, trained with SentencePiece tokenization and Whole Word Masking

Large Language Model

Transformers Other

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase